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Prufungsantrag gem. § 44 PatG ist gestellt 
(§) Skalierbarer Videocodierer gemaS MPEG2-Standard 

(§) Dem MPEG2-Standard entsprechendes digitales Videoco- 
dierersystem, ein Nur-t-Vollbitder-Videocodierermoduf mit 
einem Prozessor zur Ausfuhrung der diskreten Kosinustrans- 
formation, einer Quantisierereinheit, einem veranderliche- 
Langen-Codierer, einem FIFO-Puffer und einer Schnittsteile 
zum komprimierten Speichern, um eine l-BUder enthaltende 
Bitfolge zu erzeugen, enthaltend. Fur iPB-Bitfolgen enthalt 
das System ein zweites Prozessorelement mit einer Bezugs- 
speicher-Schnittstelle, der Fahigkeit zur Bewegungsschat- 
zung und [Compensation, zur inversen Quantisierung, zur 
inversen diskreten Kosinustransformation sowie Bewe- 
gungskompensationsmittel; und mindestens ein drittes Pro- 
zessorlement fur die Bewegungsschatzung. Das System 
kann die Form eines einzelnen tntegrierten Schaltkreischips 
Oder einer Vielzahl integrierter Schaltkreischips haben, das 
£ heiSt einen Chip fur jeden Prozessor, fur das l-Vollbild-Vi- 
deocodierermodul, fur das zweite Prozessorelement und fur 
das drirte Prozessorelement. Es konnen eine oder mehrere 
dritte Prozessoreinheiten vorhanden sein. 



Die folgenden Angaben sind den vom Anmelder eingereichten Unterlagen entnommen 
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Die Erfindung betrifft eine Vorrichtungzur Codie- 
rung digitaler visueUer Bilder einschlieBlich der raumli- 
chen (Inner-Bild) und zeitlichen Komprimierung (Zwi- 
schen-Bild), das heiBt der Verringerungder Redundant 
innerhalb eines BUdes und zwischen Bildern. Die Redun- 
danz in den Bildern wird durch die Verwendung der 
diskreten Kosinustransformation, der Quantisierung 
und der VeranderUche-Ungen-Codierung vernngert 
oder beseitigt Die Redundanz zwischen Bildern wird 
durch die Verwendung von Bewegungsvektoren vernn- 
gert oder sogar beseitigt Im besonderen betrifft die 
Erfindung ein skalierbares Codierersystem. Das heiBt, 
ein dem MPEG2-Standard entsprechendes Vuieocodie- 
rersystem mit skalierbarem Aufbau, das ein Nur-I-VoU- 
bilder-Videocodierermodul mit einem Prozessor zur 
Ausfuhrung der diskreten Kosinustransformation, ei- 
nem Quantisierer, einem Veranderuche-Langen-Codie- 
rer, einem FIFO-Puffer und einer Schnittstelle zum 
komprimierten Speichern aufweist, um erne I-VoUbdder 
enthaltende Bitfolge zu erzeugen. FOR IPB-Bitfolgen 
enthalt das System ein zweites Prozessorelement mit 
einer Bezugsspeicher-Schnittstelle, der Fahigkeit zur 
Bewegungskompensation, zur inversen Quantisierung, 
zur inversen diskreten Kosinustransformation sowie 
Bewegungskompensationsmittel; und mindestens ein 
drittes Prozessorelement fur die Bewegungsschatzung. 
Das System kann die Form eines einzelnen mtegnerten 
Schaltkreischips oder einer Vielzahl integnerter Schalt- 
kreischips haben, das heiBt ein Chip fur jeden Prozessor, 
fur das I-Vollbild-Videocodierermodul, fur das zweite 
Prozessorelement und fur das dritte Prozessorelement. 
Es konnen eine oder mehrere dritte Prozessoremheiten 
vorhanden sein. 

Hintergrund der Erfindung 

Innerhalb der letzten zehn Jahre hat der Fortschritt 
der weltweiten elektronischen Nachrichtubertragungs- 
systeme die Art und Weise, in der Menschen Informatio- 
nen senden und empfangen konnen, verbessert Im be- 
sonderen haben sich die MSglichkeiten der Echtzeit-Vi- 
deo- und Audiosysteme in den letzten lahren wesentuch 
verbessert. Urn den Teilnehmern Dienste bereitzustel- 
len, wie beispielsweise Video-auf-Abruf und Videokon- 
ferenzen, ist eine sehr groBe Bandbreite des Netzwer- 
kes erforderlich. Tatsachlich ist die Bandbreite des Net- 
zes haung das Haupthindernis fur eine effektive Ar- 
beitsweisesolcher Systeme. 

Um die durch die Netzwerke hervorgerufenen Be- 
schrankungen zu uberwinden, sind Kompnmierungssy- 
steme entstanden. Diese Systeme verringern den Um- 
fang der Video- und Audiodaten,die ubertragen werden 
mussen, indem in den Bildfolgen auftretende Redundan- 
zen entfernt werden. Am Empfangsende wird die Bild- 
folge dekomprimiert und kann in Echtzeit angezeigt 
werden 

Ein Beispiel fur einen entstandenen Videokompnmie- 
rungsstandard ist der MPEG-Standard (Moving Picture 
Experts Group). Innerhalb des MPEG-Standards wird 
die Videokomprimierung sowohl innerhalb eines -gege- 
benen Biides ais auch zwischen Bildern defimert Die 
Videokomprimierung innerhalb eines Biides wird durch 
Wandlung des digitalen Biides aus dem Zeitbereich m 
den Frequenzbereich mittels einer diskreten Kosinu- 
stransformation, einer Quantisierung, emer veranderli- 
che-Langen-Codiemng und der Huffman-Codierung 



durchgefuhrt. Die VideolBB&rimierung zwischen Bil- 
dern wird mit einem ProzeB durchgefuhrt, der als Bewe- 
gungsschatzung bezeichnet wird, in welchem em Bewe- 
gungsvektor zusammen mit Differenzdaten verwendet 
wird, um die Bewegung eines Satzes Bildelemente aus 
einem Bild in ein anderes zu beschreiben. 

Der ISO MPEG2-Standard spezifiziert nur die Syntax 
der Bitfolge und die Semantik des Decodierprozesses. 
Die Auswahl der Codierparameter und die Kompromis- 
se zwischen Leistungsfahigkeit und Komplexitat blew 
ben dem Entwickler der Codierer uberlassen. Da die 
Entwicklung eines dem MPEG2-Standard entsprechen- 
den Codierers komplex und teuer ist, ist erne solcne 
Codierer-Losung wunschenswert, die flexibel ist, um an 
verschiedene Anwendungen angepaBt zu werden, und 
die erweitert werden kann, wenn die Anforderungen des 
Benutzers wachsen, das heiBt ein skalierbarer Codierer. 

Der MPEG2-Standard erfordert zur Verarbeitung ei- 
nes VideobQdes eine zehnmal hohere Leistungsfahigkeit 
und eine vier mal hohere Auflosung als der 
MPEGl-Standard. Es wird somit zu emer groBen Her- 
ausforderung fiir die Entwickler, ein bezahlbares Codie- 
rerprodukt zu schaff en. Der MPEG2-Standard stellt Be- 
triebsweisen bereit, die fiir einige Anwendungen vorteil- 
haft sind, erfullt andere aber nur in bestimmten Gren- 
zen Eine skalierbare Produktarchitektur, die Wachs- 
tumsmoglichkeiten und wirtschaftliche Abstufungen 
bietet, ist sehr wunschenswert 
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Auf gaben der Erfindung 

Es ist eine Hauptaufgabe der Erfindung, eine skalier- 
bare Codiererarchitektur und deren Realisierung be- 

reitzustellen. • „ cu« 

Es ist eine weitere Aufgabe der Erfindung, eine Ska- 
lierbarkeit bereitzustellen. die es gestattet, aus densel- 
ben Elementen Nur-I, I-P und I-P-B Systeme aufzubau- 
en. 

Zusammenf assung der Erfindung 

Diese und andere Aufgaben werden durch den dem 
MPEG2-Standard entsprechenden digitalen Videoco- 
dierer der Erfindung mit skalierbarer Architektur er- 
fullt Das skalierbare Prozessorsystem besitzt em Nur- 
I-Vollbilder-Videocodierermodul mit einem Prozessor 
zur Ausfuhrung der diskreten Kosinustransformation, 
einer Quantisierereinheit, einem Veranderkche-Lan- 
gen-Codierer, einem FIFO-Puffer und eiper Schnittstel- 
le zum komprimierten Speichern, um .eine : I-Vollbilder 
enthaltende Bitfolge zu erzeugen. FOR IPB-Bitfolgen 
enthalt das System ein zweites Prozessorelement mit 
einer Bezugsspeicher-Schnittstelle, der Fahigkeit zur 
Bewegungsschatzung, zur inversen Quantisierung, zur 
inversen diskreten Kosinustransformation sowie Bewe- 
gungskompensationsmittel; und mindestens ein drittes 
Prozessorelement fur die Bewegungsschatzung. Das Sy- 
stem kann die Form eines einzelnen mtegnerten Schalt- 
kreischips oder einer Vielzahl integnerter Schalt- 
60 kreischips haben, das heiBt ein Chip fur jeden Prozessor, 
fur das I-Vollbild-Videocodierermodul, fur das zweite 
Prozessorelement und fur das dritte Prozessorelement. 
Es konnen eine oder mehrere dritte Prozessoremheiten 
vorhanden sein. 
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Die Figuren 

Die Erfindung kann unter Bezugnahme auf die anhan- 
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genden Figuren klarer verstanden werden. 

Fig. 1 zeigt einen SignalfluBplan eines dem 
MPEG2-Standard entsprechenden verallgemeinerten 
Codierers 11, der eine Einheit zur Ausfuhrung der dis- 
kreten Kosinustransformation 21, einen Quantisierer 23, 5 
einen Veranderliche-Langen-Codierer 25, einen inver- 
sen Quantisierer 29, eine Einheit zur Ausfuhrung der 
inversen diskreten Kosinustransformation 31, eine Be- 
wegungskompensation 41, einen Voilbildspeicher 42 
und eine Bewegungsschatzung 43 enthalt Die Daten- 10 
pfade enthalten den Eingang fur das i-te Bild 111 sowie 
Differenzdaten 112, Bewegungsvektoren 113, den Bild- 
ausgang 121, die Bildruckfuhrung fur die Bewegungs- 
schatzung und Kompensation 131 und fur das bewe- 
gungskompensierte Bild 101. Diese Figur setzt voraus, 15 
daB das i-te Bild im Bildspeicher 42 vorhanden ist und 
daB das i+lste Bild mittels Bewegungsschatzung co- 
diert wird 

" Fig. 2 verdeutlicht die I-, P- und B-Bilder, Beispiele 
ihrer Anzeige- und Obertragungsreihenfolge und die 20 
Vorwarts- und Ruckwarts-Bildvorhersage. 

Fig. 3 verdeutlicht die Suche des Bewegungsschat- 
zungsblockes im aktuellen Vollbild oder Bild nach dem 
am besten uberemstimmenden Block im nachfoigenden 
oder vorhergehenden Vollbild oder Bild. Die Elemente 25 
211 und 211' steilen denselben Ort in den beiden Bildern 
dar. 

Fig. 4 verdeutlicht die Bewegung von Blocken ent- 
sprechend der Bewegungsvektoren von ihrer Position 
innerhaib eines vorhergehenden Bildes zu einem neuen 30 
Bild, und die nachgesteilten Blocke des vorhergehenden 
Bildes nach der Anwendung von Bewegungsvektoren. 

Fig. 5 zeigt die Combination von drei Codiererchips 
der Erfindung. Dieses sind der Intra-Chip oder Intra- 
Prozessor 601 , der Weiterverarbeitungs-Chip oder Wei- 35 
terverarbeitungs-Prozessor 801, hierin ebenfaJls gleich- 
bedeutend als Rekonstruktions-Chip oder Rekonstruk- 
tions-Prozessor 801 bezeichnet, der Suche-Chip oder 
Suche-Prozessor 901 und die zugeordneten RAM-Chips 
531, 533 und 535, einschlieBlich DRAM-Chips und 40 
SRAM-Chips. Der Intra-Chip oder Intra- Prozessor ent- 
halt die Schnittstelle zum -Leitrechner, einen digital ge- 
filterten Videoeingang 541 und einen Ausgang fur kom- 
primierte Videodatea 

Fig. 6 zeigt ein I-VollbOd-Videocodierermodul 601 45 
mit einer Leitrechner-Schnittstelle 611, einem internen 
RISC-Prozessor 621, einer Schnittstelle zum Bewe- 
gungsschatzungsmittel 631, einer Bildelemente-Schnitt- 
stelle 641 zum Empfangen von BildeJementedaten von 
einem Bildelementebus 643, einer Bildspeicher-Schnitt- 50 
stelle 651 zum Empfangen von Vollbilddaten von und 
zum Senden von Vollbilddaten an einen externen RAM 
653, einen Prozessor zur Ausfuhrung der diskreten Ko- 
sinustransformation (DCT- Prozessor) 671, eine Quanti- 
sierungseinheit 673, einen Veranderliche-Langen-Co- 55 
dierer 675, einen FIFO-Puffer 677 und eine Schnittstelle 
zum komprimierten Speichern 679. 

Fig. 7 zeigt das Bildspeicherabbild 701 mit einem pri- 
vaten Speicher 711 fur den Prozessor sowie fiinf Spei- 
chersegmenten 72 1, 723, 725, 727 und 729. 60 

Fig. 8 zeigt einen S-Chip oder Prozessor 801 mit einer 
Suchspeicher-Schnittstelle 811, einem Suche- Eingabe- 
puffer 821, einer Suche- Bewegungsschatzung 803 und 
einer X-Chip-Schnitts telle 831. 

Fig. 9 zeigt einen Weiterverarbeitungs-Chip oder 65 
Prozessor 901 mit einer Bezugsspeicher-Schnittstelle 
911, einem Weiterverarbeitungs-Eingabepuffer 921, ei- 
ner Weiterverarbeitungs-Bewegungsschatzung 903, ei- 



nem IR-Chip oder einer Prozessorschnittstelle 931, ei- 
nem Weiterverarbeitungs-Chip oder Prozessorelement 
905', einer inversen Quantisierung (IQ) 941, einer inver- 
sen diskreten Kosinustransformationseinheit (IDCT) 
943 und einer Fehlervorhersage und Bewegungskorn- 
pensation945. 

Detaillierte Beschreibung der Erfindung 

Die Erfindung betrifft skalierbare Codierer und Co- 
dierverfahren, die den MPEG- und HDTV-Standards 
entsprechen. Die Codierf unktionen, die von dem Codie- 
rer ausgefuhrt werden, enthalten die Dateneingabe, die 
raumliche Komprimierung, die Bewegungsschatzung, 
die Erzeugung der Makroblock-Arbeitsweise, die Da- 
tenrekonstruktion, die Entropiecodierung und die Da- 
tenausgabe. Die raumliche Komprimierung enthalt die 
diskrete Kosinustransformation (DCT), die Quantisie- 
rung und die Entropiecodierung. Die zeitliche Kompri- 
mierung enthalt intensive Rekonstruktionsfunktionen 
wie beispielsweise die inverse diskrete Kosinustransfor- 
mation, die inverse Quantisierung und die Bewegungs- 
kompensation. Die Bewegungsschatzung und Kompen- 
sation sind zeitliche Komprimierungsfunktionen. Die 
raumliche und zeitliche Komprimierung sind sich wie- 
derholende Funktionen mit hohen Verarbeitungsanfor- 
derangen. 

Im besonderen betrifft die Erfindung einen skalierba- 
ren Prozessor zur Ausfuhrung der raumiichen und zeit- 
lichen Komprimierung, einschlieBlich der diskreten Ko- 
sinustransformation, der Quantisierung, der Entropieco- 
dierung, der Bewegungsschatzung, der Bewegungskom- 
pensation und der Vorhersage, und noch spezieiler ein 
skalierbares System zur Ausfuhrung der raumiichen und 
zeitliche Komprimierung. 

Das skalierbare Prozessorsystem der Erfindung be- 
sitzt ein Nur-I-Vollbilder-Videocodierennodul mit ei- 
nem Prozessor zur Ausfuhrung der diskreten Kosinu- 
stransformation, einen Quantisierer, einen Veranderii- 
che-Langen-Codierer, einen FIFO-Puffer und einer 
Schnittstelle zum komprimierten Speichern, urn eine 
I-Vollbilder enthaltende Bitfolge zu erzeugen. Fur IPB- 
Bitfolge enthalt das System ein zweites Prozessorele- 
ment mit einer Bezugsspeicher-Schnittstelle, der Fahig- 
keit zur Bewegungskompensation, zur inversen Quanti- 
sierung, zur inversen diskreten Kosinustransformation 
sowie Bewegungskompensationsmittel; und mindestens 
ein drittes Prozessorelement nlr die Bewegungsschat- 
zung. Das System kann die Form eines einzelnen inte- 
grierten Schaltkreischips oder einer Vielzahl integrier- 
ter Schaltkreischips haben, das heiBt einen Chip fur je- 
den Prozessor, fur das I- Vollbild- Videocodierermodul, 
fur das zweite Prozessorelement und fur das dritte Pro- 
zessorelement Es konnen eine oder mehrere dritte Pro- 
zessoreinheiten vorhanden sein. 

Der erste Komprirnierungsschritt ist die Beseitigung 
der raumiichen Redundanz, zum Beispiel der Beseiti- 
gung der raumiichen Redundanz in einem stehenden 
Bildabschnitt eines T-Vollbildes. Raumliche Redun- 
danz ist die Redundanz innerhaib eines Bildes. Wegen 
der auf Blocken basierenden Natur des Bewegungs- 
kompensationsprozesses, der unten beschrieben wird, 
war es fur den MPEG2-Standard wiinschenswert, ein 
auf Blocken aufbauendes Verfahren zur Verringerung 
der raumiichen Redundanz zu verwenden. Das Verfah- 
ren der Wahl ist die diskrete Kosinustransformation und 
die diskrete Kosinustransformationscodierung des Bil- 
des. Die diskrete Kosinustransformationscodierung 
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wird mit einer gewichteten skalaren Quantisierung und ^JSS^SffiSfe^SSS^ SE 
einerLauflangencodierungkomb^umn^hweue. g™*J^3S^ und die eingegebenen Bilder 
gehende Kompnmierungsniveaus zu err«chen. ze itweilig gespeichert werden, bis sie zur Codie- 
Die diskrete Kosinustransformation ist e«« SS^Sdet wlrden. Ein Puffer speichert diese Em- 
ode Transformation. Ormogonale Transformauonen 5 ^^^^endet werden. 
sind, da sie iiber den Frequenzbereich "W^TSK ^ItoXJSictai wird in Kg. 1 ein verallge- 
den, auf Filtersatze orientiert. Die diskrete Kosmu- m £ U e £" «L^ u BDlan eines dem MPEG-Standard 
transformation ist ebenfalls eine lokale Transforma- ^^^SdCs gezeigt In dem SignalfluB- 
tion.DastaeiBt.derCodierprw^ ent* precb en den ^ ^ d £ ^ Bildes und des . 

Fenster der GroBe 8 x 8 ab, "-J^SdeV n 2 1 SsTen B^des verarbeitet.um Bewegungsvektoren zu 
TransformationskoeffizientenoderUnter-Banderzuer ^ ugen Die Bewegungsvektoren sagen voraus, wo 

'^weiterer Vorteu ^ *--g^ ghein 

madonbestehtdarin,c^schneUeC^dier-undDecod»^ ^^^rwendung von Bewegungsvektoren anstatt 
ralgorithmen verfugbar sind Zusatzhch verhalt sich d« 15 «££3^S£^ ein Schllsselaspekt der zeitli- 
Unter-Band-Zerlegung der diskreten Kosmustr^sfor^ ^£^3^ m den MPEG- und HDTV-Stan- 
mation ausreichend gleichformig, urn die Anwendung ^^jJ^L t .LgesteUt, werden die Bewegungs- 
psycho-visueller Kritenen zu gestatten. vektoren. wenn sie einmal erzeugt wurden, verwendet, 

Nach der Transformation sind ^ ^SeweSng der Bildelemente-Makroblocke vom 

zientennull,imbesonderendie BCoeffeentento hohe 20 ^^^Jf^ Bud zu beschreiben. 
raumliche Frequenzer, Diese Koeffizienten werden m . ^J 2 ^ \ dargeste llt, werden die Darstellungen 
Form eines Zickzackmusters <"W»^ .f? * d^-ten Bildes und des i+ lsten Bildes im Laufe des 

Amplitudes (Lauf-Pegel) Paaregewandelt ledK te des » n ™ . Codierer 11 verarbeitet, urn die Be- 
zei£ die Anzahl von NuU-Koeffizienten und die Amph- ^S^ktoren^u erzeugen, welche die Art und Wei- 
tude der Nicht-Null Koeffizienten an. D ies wmi m ei- * l^^Z^erz^spi^i + U^ndfe 
nemVeranderliche-Langen-Codecodiert nac hfoleenden Bilder codiert und abertragen werden. 

Die Bewegungskompensation wird verwendet urn ^5 Hnlabe^adabschnitt 111 eines nachf olgenden Bil- 
die Redundanz zwischen Bildem ^ jeirmgern oder so- Em tmgao hat2un einheit4 3 des Co- 

gar zu beseitigen. Die Bewegungskompensaoon nutzt aes ™ a °*™ ^ Wangssignal der Bewegungs- 
LzeitUche Redundanz aus ^J^£S££^ SK£5SeVS werden^eBewegungsyektoren 
Blocke unterteilt wird, zum Beispiel Makrob locke, una scn^u . g Vektoren werden durch die Bewe- 

^^^^^^^T^^S^ ^S^S^At 41 verwendet, urn Makro- 
einem nahegelegenen Block nut e ™ X£Lf n btockdaten aus vorhergehenden und/oder zukunftigen 

sucht wird. Nur die Differenz zwischen den Bddelemen- ^^en, 4 ^ "Bezugsdaten" bezeichnet 

ten des aktuellen Blockes und der i™****^ 35 ™Z ™dT™n*dieser Einheit ausgegeben werderu 
vorhergesagten Blockes. der aus dem J^bJiaW Jin Ausgabewert der Bewegungskompensationseinheit 
blendet wird, wird fur die Ubertragung tatsachhch kom . Jf^J* ativ m dem Ausgabewert der Bewegungs- 

primiert und anschlieflend ubertragen. schatzuneseinheit 43 addiert und auf den Eingang der 

Das einfachste Verfahren der Bewegungskompensa- schateungs f™ 1 ^ d diskreten Kosinustrans- 

UO n und Vorhersage besteht darn, HeUigkeits- und 40 ^Jj^^^^j ^e^ebeniDie^^usgabe der Einheit 21 zur 
Farbwerte, d. h. die Intensity und die Farbe, jedes Bud- ^^^^^^ Koiinustransformation wird 
elementes in einem T-BHd aufzuze.chnen und dam Aus ™S ^ ^ ^ert Der Ausgang des 

Veranderungen der Helligkeits- und F^erte^^^ SiSereT^ wird in zwei Ausgange, 121 und 131, 
intensity und der Farbe. fur jedes spezielle Badelement ^SSK S. I^sgang 121 gehfauf ein nacbgeord- 
in dem nachfolgenden BUd aufzuzeichnetu Die^ > * 45 ^ J 5 ^^ ^ J. * eiteTm Komprimierung und 
doch bezuglich der BandbreUe des Obemagungsme- nete^ ™«™* Qbertragung, wie beispielsweise 

diums.desS P eicherbedarfs.derProzessorkapa^timd ^^f^^erer; der andere Ausgang 131 

der Verarbeitungszeit ^^^^6^'- dSiTd^Rekonstruktion des codierten BUdele- 

schendenBudernObjektebewegead^ heiBt Bddele °^_ Makroblockes ^ Speichern im Bezugsspei- 

menteinhalte bewegen sich von emem Ort m emem Bdd 50 mate MaKxoo Rx J cken ge2e igten Co- 

zuememanderenOrtineinemnacMolgendenBild.^ dur ^hlauft der zweite Ausgabewert 131 erne in- 

bessere Idee besteht dann. em vorhergehendes ; oder 39 ^ ein e inverse diskrete Ko S1 - 

nachfolgendes Bild zu benutzen. urn vorherzusagei^wo f t ^ eine ver Iustbehaftete Version 

sich ein Bildelementeblock in emem nacMohjenden oder ^SStaSSSblocke. zuruckzugeber, Diese Da- 

Bildes in dem i- lsten oder 1+ lsten Bild auftre^ »n 1 wer ubertragen werden und kerne Be- 

den. Ein weiterer Schritt besteht dann, ^^^^ wS^g^ekToren benotigen. Diese 'T-Bilder dienen als 

gende als auch vorhergehende Bilder zu verwenden .urn ^fj"^^ g toreiL Es gftt "Vorhergesagte 

vorherzusagen, wo sich ein Budelementeblock in emem g^JJJV.S/ welche durch Bewegungsvekto- 
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tungs-Bilder" oder "B"*BiId^PHche durch Bewegungs- 
vektoren aus zwei anderen Bildern gebildet werden, ei- 
nem vergangenen und einem zukunftigen, und die nicht 
als Quelle von Bewegungsvektoren dienen konnen- Be- 
wegungsvektoren werden aus T- und "P'-Bildern er- 5 
zeugt und verwendet, urn "P"- und "B"-Bilder zu bilden. - 
Ein Verfahren, mittels dem die Bewegungsschatzung 
ausgefuhrt wird, wird in Fig. 3 dargestellt und ist ausge- 
hend von einem Makroblock 21, die Suche eines i-ten 
Bildes innerhalb eines Bereiches des nachsten Bildes, um 10 
den am besten ubereinstimmenden Makroblock 213 zu 
finden. Das Verschieben der Makroblocke auf diese Art 
und Weise ergibt fur das i-hlste Biid ein Makroblock- 
muster, wie es in Fig. 4 dargestellt wird. Auf diese Weise 
wird das i-te Bild ein wenig verandert, z. B. durch Bewe- 15 
gungsvektoren und Differenzdaten, um das i+ iste Bild 
zu erzeugen. Was codiert wird, sind die Bewegungsvek- 
toren und Differenzdaten und nicht das i + lste Bild 
selbst Bewegungsvektoren verschieben die Position ei- 
nes Bildabschnittes von Bild zu Bild, wahrend die Diffe- 20 
renzdaten Veranderungen in Helligkeit, Farbwerten 
und der Sattigung ubertragen, d. h. Veranderungen in 
den Schatten und der Beieuchtung. 
^ Wir kehren zu Fig. 3 zuriick und suchen eine gute 
Ubereinstimmung, indem im i-ten Bild sowie im i 4- Isten 25 
Bild von demselben Ort ausgegangen wird. Im i-ten Bild 
wird ein Suchfenster erzeugt Gesucht wird eine beste 
Obereinstimmung innerhalb dieses Suchfensters. Ein- 
mal gefunden, werden die Bewegungsvektoren fur den 
am besten ubereinstimmenden Makroblock codiert Die 30 
Codierung des am besten ubereinstimmenden Makro- 
blockes beinhaltet einen Bewegungsvektor das heiBt, 
wieviele Bildelemente in y : Richtung und wieviele Bild- 
elemente in x-Richtung der am besten ubereiristimmen- 
de Makroblock im nachsten Bild verschoben ist. Die 35 
Differenzdaten, auch als "Vorhersagefehler" bezeichnet, 
welche die Differenz in Farbwerten und Helligkeit zwi- 
schen dem aktuellen Makroblock und dem am besten 
ubereinstimmenden Bezugs-Makroblock angeben, wer- 
den ebenfalls codiert 40 

Die Arbeitsfunktionen eines MPEG2-Codierers sind 
in drei grundlegenden Elementen realisiert: einem I- 
oder Intra-Element, einem R- oder Weiterverarbei- 
tungs- oder Rekonstruktions-Element und einem S- 
oder Suche-Element Die Funktionen sind entsprechend 45 
der Anwendungsanforderungen, der ChipgroBe, der 
Entwicklungswerkzeuge und Komplexitat und der Lei- 
stungsfahigkeit unterteilt 

Wie in Fig. 6 dargestellt, findet die gesamte externe 
Kommunikation einschlieBlich der Bildelemente- 50 
SchnittstelJe 641, der Leitrechner-Schnittstelle 611 und 
der Datenausgabe-Schnittstelle 679 fiber ein einzeines 
I-Element 601 statt Das I-Element 601 ist die Master- 
Schnittstelle des Codierers und eine grundlegende An- 
forderung in einer beliebigen Videokomprimierungsan- 55 
wendung unter Verwendung des Chipsatzes der Erfin- 
dung, wie sie in Fig. 5 dargestellt ist In diesem Chip ist 
ein programmierbarer Prozessor 621 zusammen mit 
den Entropiecodierfunktionen, das heiBt der diskreten 
Kosinustransformations-Prozessoreinheit 6713 der eo 
Quantisierungseinheit 673, und einem Veranderliche- 
Langen-Codierer 672 integriert Infolgedessen konnte 
dieses Bauelement in einer Anwendung eingesetzt wer- 
den, die nur das Codieren von Nur-I-Vollbildern erfor- 

dert Um funktionelle Erweiterungen zu er moglichen, ss orientiertes Format empfangen und codierte Felder 
ist eine Rekonstruktions-SchnittsteUe hinzugefugt wor- oder Vollbilder ausgeben, unabhangig davon, welches 
den. Die vor der Codierung anzuwendenden Verarbei- Format die Eingabe hatte. Eingabedaten 4 : 2 : 2 konnen 
tungsfunktionen sind ebenfalls in diesem Bauelement als 4 : 2-2 oder 4 : 2:0 Ausgabedaten codiert werden. Der 
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enthalten. 

Die wiederaufbauende Verarbeitung des Makroblok- 
kes ist fur alle I-Vollbild- und P-Bild-Codierungen erfor- 
deriich. Funktionen wie die inverse diskrete Kosinu- 
stransformation 943 (IDCT), die inverse Quantisierung 
941 (IQ) und die Bewegungskompensation 903 (MC) 
sind in einem einzelnen Chip untergebracht, dem 
R-Chip oder R-Prozessor 901, wie er in Fig. 9 darge- 
stellt ist Eine gering entwickelte Bewegimgsschat- 
zungsfahigkeit mit einem programmierbaren Prozessor 
wird ebenfalls hinzugefugt, um Anwendungen mit lang- 
samen Bewegungen zu behandeln. Fiir Anwendungen 
mit hoheren Anforderungen an die Bewegungsschat- 
zung ist eine Ergebnissuche-Schnittstelle eingebaut Da- 
durch konnen I- und R-Chip zusammen in Anwendun- 
gen mit wenig Bewegung eingesetzt werden, wie bei- 
spielsweise Fernunterricht, Videokonferenzen, fur 
Oberwachungsaufgaben usw. 

Die Bewegungsschatzung ist eine sich wiederholende 
Funktion und stellt hohe Anforderungen an die Verar- 
beitung. Ein Hardware-Bauelement, der Suche-Chip 
oder Suche-Prozessor 801, der in Fig. 8 mit extern pro- 
grammierbaren Registern dargestellt ist, ist fur diese 
Funktion vorgesehen. Es ist eine Erweiterungs-Schnitt- 
stelle vorhanden, um einen groBeren Suchbereich zu 
erhalten. Die Drei-Chip-Konfiguration kann fur Anwen- 
dungen wie Rundfunkubertragungen und dergleichen 
eingesetzt werden. Fur schnellere Bewegungen, bei- 
spieisweise bei wissenschaftlichen Anwendungen mit 
Hochgeschwindigkeitsfotografie konnen zusatzliche 
S-Chips eine hohere Bildqualitat mit einem groBeren 
Suchbereich bereitstellen. Dies ist eine . skalierbare Ei- 
genschaft der vorliegenden Architektur. 

Chip-Unterteilung 

Die Verbindungen der drei Codiererchips sind in 
Fig. 5 dargestellt Fig. 5 zeigt die {Combination der drei 
Codiererchips der Erfindung. Dieses sind der Intra-Chip 
oder Intra-Prozessor 601, der Weiterverarbeitungs- 
Chip oder Weiterverarbeitungs-Prozessor 801, der Su- 
che-Chip oder Suche-Prozessor 901 und die zugeordne- 
ten RAM-Chips 531, 533 und 535 einschlieBlich D RAM- 
Chips und S RAM-Chips. Der Intra-Chip oder Intra-Pro- 
zessor enthalt die Schnittstelle zum Leitrechner, einen 
digital gefilterten Videoeingang 541 und einen Ausgang 
fur kofnprimierte Videodaten 543. 

I-Chip 

Der in Fig. 6 dargestellte I-Chip behandelt die Einga- 
bedaten 541 und die Ausgabebitfolge 543 des Codierer- 
systems. Die eingehenden Bildelementedaten werden 
im Vollbildformat in einem externen DRAM gespei- 
chert, der als Vollbildspeicher bezeichnet wird. Dieser 
Chip ffihrt die Kernfunktionen aus, die fur die I- Vollbild- 
Codierung erforderiich sind. Die Bildelementedaten 
werden, wenn erforderiich, aus dem RGB- Format in das 
YCbCr-Format gewandelt Die Bildelementedaten wer- 
den auf Szenenanderungen und auf sich wiederholende 
Felder uberwacht, auf der Basis von 3 : 2 Auszugen. Die 
eingehenden Bildelementedaten werden ebenfalls nach- 
gestellt, um ein HHR-Ausgabeformat zu erzeugen. Der 
Codierer kann eine feldorienuertes oder ein vollbild- 



DE 197 02 048 Al 



9 A 

auf dem Chip integrierte RISC-F^^feor 621 ist fur die 
adaptive DCT, die adaptive Quantisierung und die Ge- 
schwindigkeitssteuerung verantwortlich. Der Prozessor 
besitzt eine dynamisch unterteilbare Struktur, die es ihm 
gestattet, als 4-Byte-Maschine oder als vier 1-Byte-Ma- 
schinen zu arbeiten. Dies wird in unserer gemeinsamen, 
ebenfalls anhangenden US-Patentanmeldung Nr. 
08/411 239 vom 27. Marz 1995 von Charles Boice, John 
M. Kaczmarczyk, Agnes Ngai und Robert C Woodard 
mit dem Titel "DYNAMICALLY PARTITIONABLE 
DIGITAL VIDEO PROCESSOR" beschrieben, deren 
Offenbarung durch diese Bezugnahme hierin mit aufge- 
nommen wird. 

Die codierten Bilddaten werden mit Kopfzeileninfor- 
mationen vermischt, wie dies in unserer gemeinsamen, 
ebenfalls anhangenden US-Patentanmeldung Nr. 
.08/410 951 vom 27. Marz 1995 von James D. Greenfield, 
Diane M. Mauersberg und Agnes Ngai mit dem Titel 
"APPARATUS FOR HEADER GENERATION" be- 
schrieben, deren Offenbarung durch diese Bezugnahme 
hierin mit aufgenommen wird Dies erzeugt die letzt- 
endliche MPEG-2- oder MPEG-l-BitfoIge, welche der 
Codierer in einen externen DRAM oder FIFO schreiben 
kann, zum Beispiel uber die Schnittstelle 679 zum kom- 
primierten Speichern. Wenn das Bild in einem DRAM 
gespeichert wird, kann es durch den Benutzer uber die 
Leitrechner-Schnittstelle in Nicbt-Echtzeit ausgelesen 
werdea 

Der R-Chip 901, ebenfalls als Weiterverarbeitungs- 
Chip oder Rekonstruktions-Chip bezeichnet, der in 
Fig. 9 dargestellt ist, ist fur die Weiterverarbeitung mit- 
tels Suchverfahren zur Bewegungsschatzung und fur die 
Bildrekonstruktion zur Bewegungskompensation ver- 
antwortlich. Zur Unterstiitzung der Bewegungsschat- 
zungsfunktion wird extemer DRAM eingesetzt Die 
Funktionseinheiten des R-Chips fuhren alle die Grund- 
funktionen aus, die fur die Rekonstmktion der Bilder 
und fiir die Bewegungsschatzung erforderlich sind. 

Die Hauptfunktionen des Prozessors sind auf Makro- 
blocken basierende Entscheidungen, die Einstellung des 
Suchbereiches pro Bild und die Unterstutzungen der 
Bewegungsschatzung. Die Quantisiererdaten werden 
von der Bewegungsschatzer-Schnittstelle 631 des 
I-Chips empfangen, wahrend s-Chip-Suchergebnisse 
vom S-Chip auf der X-Chip-Schnittstelle 831 empfan- 
gen werden. Quantisierte Daten werden dann unter 
Verwendung von bis zu vier Matrizentabellen dequanti- 
siert Die IDCT wandelt uber eine zweidimensionale 
inverse Transformation die Koeffizienten in Bildele- 
mentedaten urn. Diese rekonstruierten Bilddaten wer- 
den als^Bezugsdaten fur nachfolgende Bildcodierungen 
uber die Speicher-Schnittstelle gesichert Die Bewe- 
gungsschatzung kann Feld- und Bildbewegungen, dop- 
pelte, einzelne und Zweirichtungs-Bewegungen bis zu 
einer Auflosung von einem halben Bildelement fiir I- 
P-und B-Bilder unterstutzen. 

Die Zwei-Chip-Konfiguration (Intra- und Weiterver- 
arbeitungs/ Rekonstruktions-Chips) kann einen suchbe- 
reich bis zu +/- 8horizontal und +/-7vertikal unter- 
stiitzen, und die Drei-Chip-Konfiguration (Intra-, Wei- 
terverarbeitungs/Rekonstruktions- und Suche-Chips 
kann einen suchbereich bis zu + /— 64horizontal und 
+/-56vertikal unterstutzen. Wenn Bewegungsschat- 
zungsergebnisse benotigt werden, werden die GroBe 
des Suchfensters und die Ergebnisse der Suche nach der 
besten Obereinstimmung bestimmt und die Makro- 
block-Differenzdaten erzeugt. 
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Der Suche-Chip 801, der in Fig. 8 dargestellt ist, ist fur 
den Hauptanteil der Bewegungsschatzung verantwort- 
5 lich. Der Zweck der Bewegungsschatzung besteht darin, 
den Platz eines Makroblockes aus dem aktuellen Bild 
(CMB) in dem Bezugsbild zu finden. Dieser Ort wird 
bestimmt, indem die beste Obereinstimmung gefunden 
wird, welche durch Vergieichen der CMB-Daten mit 
io den Bezugsbilddaten und Einbeziehen eines systemati- 
schen Faktors, welcher auf der Bewegung der vorherge- 
henden Bilder basiert, f estgestellt wird. 

Das gesamte Bezugsbild kann in Echtzeit nicht abge- 
sucht werden. Deshalb erfolgt die Suche in einem Un- 
15 tersatz des Bezugsbildes. Dieser Untersatz wird ais 
Suchfenster bezeichnet. Vergleiche Fig. 3. Je groBer das 
Suchfenster ist, desto groBer ist die Chance, eine exakte 
Obereinstimmung fur den CMB zu finden. Das Suchfen- 
ster kann deutlich vergroBert werden, indem zusatzliche 
20 Suche-Chips 801 benutzt werden. Eine leistungsfahige 
Bewegungsschatzung erzeugt Videobilder hoherer 
Qualitat und stark komprimierte Bitfolgen. Der Suche- 
Chip empfangt auf der Grundlage der Bildstruktur die 
Suchf ensterparameter von dem Prozessor auf dem Wei- 
25 terverarbeitungs/Rekonstruktions-Chip und die Hellig- 
keitsdaten entweder im Vollbild- oder Feldformat von 
dem Intra-Chip. 

Die Bezugsbilder werden im Vollbildformat in einem 
gespeichert Die Bewegungsschatzungseinheit fuhrt ei- 
30 ne Feidsuche auf dem CMB und dem Bezugsbild durch. 
Zusammen mit einem Vollbildergebnis fur Vollbild- 
strukturierte Bilder werden vier Feldergebnisse berech- 
net Die Ergebnisse haben die Form absoiuter Diffe- 
renzwerte und werden auf der Grundlage der Bewe- 
35 gungscharakteristik vorhergehender Bilder systema- 
tisch beeinfluBt Die beeinfluBten absoluten Differenz- 
werte werden zusammen mit Bewegungsvektoren an 
den R-Chip 901 gesendet. 
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Verarbeitungsablauf 



Der I-Chip 601 enthalt sowohl Vorverarbeitungs- als 
auch Entropiecodierfunktionen. Die Vorverarbeitungs- 
funktionen werden vor einer beliebigen Codierfunktion 
45 ausgefuhrt. Die Entropiecodierung ist der letzte Ab- 
schnitt der Bildverarbeitung. 

Ihr Blockschaltbild ist in Fig. 6 dargestellt 
Auf dem Intra-Chip 601 ist eine Leitrechner-Schnitt- 
stelle 611 installiert, die als Hauptsteuerkanal zwischen 
so dem Codiererchipsatz und dessen Umgebung dient 
Diese Schnittstelle ist ein generisches RAM-Protokoll 
mit 16 Datenbits und 8 AdreBbits. Die an dieser Schnitt- 
stelle definierten Register enthalten Befehle, Konfigura- 
tionsparameter, Codierparameter, Initialisierungsdaten, 
55 den elektronischen Briefkasten usw. Die Leitrechrierbe- 
fehle enthalten Start Codieren, Stopp Codieren, Abru- 
fen des komprimierten BiJdes aus dem Ausgabe-DRAM 
usw. Die Konfigurationsparameter enthalten die Spei- 
chergroBe, den Speichertyp, die im Codierersystem in- 
60 stallierte Chipanzahl usw. 

Die Codierparameter konnen beim Einschalten ge- 
setzt werden oder an einer Bildgrenze modiflziert wer- 
den, urn den CodierprozeB zu leiten. Diese Parameter 
enthalten unter anderem das Videoeingabeformat ge- 
65 geniiber dem Videoausgabeformat, die Benutzer-Matri- 
zentabellen, die Intra- VLC-Tabelle, das ZZ-Abtastmu- 
ster, die FeldWollbild-Bildcodierung, die Anzahl der Bil- 
der pro Bildfolge, die Anzahl der Bilder pro GOP, die 
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Anzahl der B-Bilder, die A^^T der Bezugsf elder und 
benutzerspezifische Daten. Diese Schnittsteile wird. 
ebenfalls verwendet, urn den Chipsatz zu initialisieren. 
Im Codiererchipsatz gibt es zwei interne Prozessoren. 
Die Befehle beider Prozessoren werden uber diese 5 
Schnittsteile heruntergeladen. Zusatzlich sind Puffer 
vorhanden, die einen speziellen Inhalt verlangen, urn 
ordnungsgemaB zu funktionieren, und diese werden 
ebenfalls uber diese Schnittsteile initialisiert 

Der elektronische Briefkasten ist ein Nachrichten- 10 
ubertragungsmechanismus zwischen dem chip-internen 
Prozessor und dem externen Prozessor. Wenn ein Be- 
fehl oder eine neue Information uber das Briefkastenre- 
gister mit dem korrekten Prozessorcode an den chip-in- 
ternen Prozessor gesendet wird, wird der neue Befehl 15 
ausgefuhrt Diese Register stellen eine gewisse Flexibili- 
tat bereit Die definierten Funktionen kdnnten wahrend 
Codierprozesses durch Leitrechner-Schreiboperatio- 
nen deaktiviert oder inaktiviert werden. 

Auf der Schnittsteile wird weiterhin ein Stapelspei- 20 
cher instaliiert, urn zu ermoglichen, dafi Register wah- 
rend des Codierprozesses verandert werden. Der Sta- 
pelspeicher besitzt eine Tiefe von zwolf Eintragen. Die 
Leitrechner-Schreiboperationen werden, wenn der Co- 
dierer mit der Codierung eines Bildes beschaftigt ist nur 25 
in diesen Stapelspeicher geschrieben. Die in den Stapel- 
speicher geschriebenen Informationen werden am Ende 
der Verarbeitung des aktuellen Bildes verarbeitet Der 
Codierer erscheint fur den externen Prozessor solange 
beschaftigt, bis der Stapelspeicher leer ist. Dieses Ent- 30 
wurfsmerkmal verringen die Kommimikationszeit zwi- 
schen der Bildverarbeitung und ermoglicht eine maxi- 
male Codierzeit 

Bildelemente-Schnittstelle 35 

Die Bildelemente-Schnittstelle ist eine 24-bit-Bildele- 
mente-Schnittstelle, die verwendet wird, um digitale 
Eingangssignale im RGB-Format zu empfangen. Sie 
kann ebenfalls 16 oder 24 bit breite YCbCr-Eingabeda- 40 
ten bearbeiten. Die Farbkonvertierungsschaltung, die 
Szenenwechsel-Erkennungslogik und die 3/2-Auszug- 
Inversionsfunktion sind ebenfalls auf dieser Schnittsteile 
instaliiert 

Der ProzeB der Farbkonvertierung, eine Form der 45 
Datenreduktion, kann Eingabedateri im 4:2:2 oder 
4:2:0 Farbwert-Codeformat umwandeliL 

Jeder Ort innerhalb eines Bildes wird durch Hellig- 
keits- und Farbwert-Bildelementdaten dargestellt Wie 
im MI>EG2-Standard spezifiziert, sind YCbCr-Daten 50 
das Eingabedatenforrnat fflr die Komprimierung und 
das Ausgabedatenformat ftir die Dekomprimierung. Fur 
RGB-Daten muB die Eingabe zuerst in das 4:2: 2- For- 
mat gewandelt werden, bevor ein CodierprozeB durch- 
gefuhrt werden kann. Wenn die Eingabedaten das 55 
4:2:2 YCbCr-Format besitzen, bedeutet dies, daB je- 
der Punkt eines Bildes durch 8 Bits Helligkeitsdaten und 
8 Bits alternativer Cb und Cr Farbdaten dargestellt 
wird. Wenn die Eingabedaten das 4 : 2 : 0 YCbCr-For- 
mat besitzen, bedeutet dies, daB jeder Punkt eines Bildes 60 
durch 8 Bits Helligkeitsdaten und horizontal und verti- 
kal untergetastete alternative Cb und Cr Farbdaten dar- 
gestellt wird. Die unnotige redundante Information wird 
durch den ProzeB der Farbkonvertierung und/oder die 
Formatdezimierung von 4 : 2 : 2 auf 4 : 2 : 0 in der Ein- 65 
gangsstufe entfernt, um einen Komprimierungsschritt 
auszufiihren und die durch den verbleibenden Codierer 
flieBende Datenmenge zu verringern. Dies verringert 
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die Leistungsanr^rorungen in den verbleibenden Ele- 
menten. 

Um einen weiten Bereich Anwendungen abzudecken, 
beschreibt der MPEG2-Standard viele Codierwerkzeu- 
ge und Optionen fur den KomprimierungsprozeB. Das 
Abwagen zwischen Qualitat/Leistungsfahigkeit und 
Komplexitat bleiben jedoch fur eine gegebene Anwen- 
dung dem Entwickler der Codierer uberlassen. Viele der 
Codieroptionen sind innerhalb eines Bildes anpaBbar, 
entweder auf Bildebene oder auf Makroblockebene. 
Diese Flexibilitat gestattet eine verbesserte Steuerung 
der Bitgeschwindigkeit Dynamische und adaptive Ver- 
andenuigeri von Codieroptionen konnten auf der 
Grundlage der vorliegenden Informationen auf zukunfr 
tige Codierungen angewandt werden, oder sie kdnnten 
audi auf Grundlage zukunftiger Informationen auf die 
aktuellen Daten angewandt werden- Die Erkennung von 
Szenenwechseln, ein Vorgriffsmechanismus, der Bildin- 
formationen vor dem CodierprozeB sammelt, stellt 
weitaus leistungsfahigere Steuermoglichkeiten bereit 
Die Erkennung von Szenenwechseln zeigt groBe Veran- 
derungen zwischen Bildern und ebenfalls Komplexitats- 
anderungen an. Die Berechnungen zur Erkennung. von 
Szenenwechseln werden mit den Eingabedaten durch- 
gefuhrt; fur die verbleibenden Funktionen ergeben sich 
keine zusatzlichen Anforderung an den Datendurchsatz 
oder die Bandbreite. Da sich die Reihenfolge der Bild- 
eingabe von der Codierreihenfolge unterscheiden kann, 
wird in der Szenenwechsel-Erkennungslogik die Infor- 
mation von bis zu drei Bildern vorverarbeitet Die Sze- 
nenwechsel-Erkennungslogik kann verwendet werden, 
um die Qualitat des gerade verarbeiteten Bildes zu re- 
gulieren. Dieser Umfang des Vorgreifens auf Informa- 
tionen gestattet es dem Codierer, die Codieroptionen 
sowohl am Beginn als auch in der Mitte der Bildverar- 
beitung dynamisch zu verandern. 

Wenn eine 3/2-Auszugsinversion (3/2 PDI) freigege- 
ben wird, enthalten die Eingabedaten redundante oder 
sich wiederholende Felder. Um leistungsfahiger zu wer- 
den, mussen die redundanten Daten vor der Codierung 
entfernt werden. Die Erkennung sich wiederholender 
Felder erfordert die Sicherung von rnindestens einem 
Feld. Der Bedarf an chip-internem Speicherplatz fur die 
Erkennung sich wiederholender Felder macht es okono- 
mischer, die Felddaten in externem Speicher aufzube- 
wahren. Die Eingabedaten werden zuerst im Vollbild- 
speicher-DRAM gespeichert und mOssen fur die Erken- 
nung sich wiederholender Felder und die Bildcodierung 
abgerufen werden. Das Erkennungsschema beruht auf 
einem 3/2-Muster. Mit einer leistungsfahigen 3/2-Aus- 
zugsinversionslogik wQrden von jeweils 30 eingegebe- 
nen Bildern nach Anwendung der 3/2-Auszugsinversion 
nur funfundzwanzig Bilder codiert Die restliche Spei- 
cherbandbreite konnte dann fur den Abruf der sich wie- 
derholenden Felddaten benutzt werdea Um den Spei- 
cherverkehr zu minimieren, wird das folgende Schema 
angewandt: Wenn die Eingabedaten zuerst ein ungerad- 
zahiiges Feld enthalten, wird die Erkennung zuerst mit 
den Daten des ungeradzahligen Feldes ausgefuhrt, und 
die Daten erkennung in einem geradzahligen Feld wird 
ausgefohrt, nachdem ein wiederholtes ungeradzahliges 
Feld erkannt worden ist Wenn die Eingabedaten zuerst 
ein geradzahliges Feld beinhalten, findet der umgekehr- 
te Vorgang statt Wenn ein Datenbyte an der Bildele- 
mente-Schnittstelle empfangen wird, wird derselbe By- 
teplatz im vorhergehenden Feld gleicher Paritat aus 
dem Vollbildspeicher wiederhergestellt Ein sich wie- 
derhoiendes Feld wird am Ende der Bildfeldeingabe er- 
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kannt Wenn das Feld ein sich wie^^pblendes Feld ist, 
wird dessen Speicherplatz fiir die Eingabe des nachsten 
Feldes derselben Paritat benutzt Dies beseitigt komple- 
xe Speicherzugriff e wahrend der Bildcodierung. 

Vollbildspeicher-Schnittstelle 

Die Vollbildspeicher-Schnittstelle ist in Fig. 7 darge- 
stellt Am Ausgang der Bildelemente-Schnittstelle sind 
die Eingabedaten soweit vorverarbeitet, um in dem an 
den Intra-Chip angeschlossenen externen Vollbild- 
DRAM gespeichert zu werden. Dieser Vollbildspeicher 
wird nur benutzt, um das eingegebene Bild (die aktuel- 
len Daten) zu speichern, bis es fur die Codierung bereit 
ist Der Datenverkehr iiber diese Schnittstelle ist etwa 
doppelt so groB wie die Obertragungsrate der Eingabe- 
daten. Es wird ein 32 bit breiter Daten bus verwendet, 
um den DRAM zu unterstiitzen, z. B. einen 70 ns 
DRAM. Fur die I- und IP-Codierformate ist die Reihen- 
folge der Bildeingabe dieselbe wie die Reihenfolge der 
Bildcodierung. Aus diesem Grund beginnt die Codie- 
rung, wenn ein Makroblock Daten verfugbar ist. In die- 
ser ^Configuration wird der Vollbildspeicher in sechs 
Segmente unterteilt, funf fiir die Daten des Eingabebil- 
des und eins fur die Verwendung durch den chip-inter- 
nen Prozessor. Fur jedes Eingabebild wird ein Segment 
des Vollbildspeichers ausgewahlt Die Daten innerhalb 
eines Bildes werden an vorgegebenen Distanzen zur 
Anfangsadresse des ausgewahlten Segmentes sequen- 
tiell gespeichert Jedes Segment hat die GroBe eines 
Viertels eines Bildes, mit Ausnahme des Segmentes fiir 
die Verwendung durch den Prozessor, das kleiner sein 
kann. Fiir jedes Eingabebild werden vier aufeinander- 
folgende Segmente verwendet. Die funf Segmente wer- 
den rotierend benutzt Die Speicherabbildung ist in 
Fig. 7 dargestellt 

Wenn das erste Eingabebild empfangen wird, wird es 
in Segment vier gespeichert Da die GroBe jedes Seg- 
mentes nur ein Viertei eines Bildes betragt, benutzt das 
erste Bild die Segmente 4, 3, 2 und 1. Das zweite Einga- 
bebild wird in den Segmenten 0, 4, 3 und 2 gespeichert 
Das dritte Bild wird in den Segmenten 1, 0, 4 und 3 
gespeichert Das vierte Bild wird in den Segmenten 2, 1, 
0 und 4 gespeichert Das funfte Bild benutzt die Segmen- 
te 3, 2, 1 und 0. Dann wiederholt sich das Muster der 
Segmentbenutzung. Dieses Schema minimiert die exter- 
nen Speicheranforderungen, fur I- und IP-Konfiguratio- 
nen werden 1 MByte DRAM benotigt Fur das IPB-Co- 
dierformat ist die Reihenfolge der Bildeingabe von der 
Reihenfolge der Bildcodierung verschieden, wie dies in 
Fig. 2 dargestellt ist Somit muB ein Eingabebild voll- 
standig gespeichert werden, bis es zur Verwendung be- 
reit ist In diesem Fall betragt die Speichergrofle 2 MBy- 
te fur NTSC und 4 MByte fur PAL. Der Vollbildspeicher 
wird in funf Segmente unterteilt, vier Eingabebilder und 
eins fur die Verwendung durch den chipinternen Pro- 
zessor. Jedes Segment hat die gleiche GroBe wie ein 
Bild Es wird auf ahnliche Weise benutzt wie bei den 
Nicht-IPB-Formaten. Dieses Schema ermoglicht auf 
Grundlage des Codierformates skalierbare Speicheran- 
forderungen. 

Der hauptsachliche Speicherverkehr iro Vollbildspei- 
cher besteht aus dem Speichern der Eingabedaten, dem 
Datenabruf bei der 3/2-Auszugsinversion und dem Ab- 
ruf von Codierdaten. An der Vollbildspeicher-Schnitt- 
stelle wird ein Prioritatsschema angewandt, wobei die 
Eingabedaten die hochste Prioritat aufweisen und der 
Datenabruf fiir die Auszugsinversion die niedrigste 



Prioritat aufweist Eind^^Hpheranforderung zum Spei- 
chern von EingabedateiTTOrd ausgegeben, wenn 32 By- 
tes oder mehr Daten in der Bildelemente-Schnittstelle 
eingegangen sind. Die Daten werden kontinuierlich im 

5 DRAM gespeichert, jeweils 4 Bytes gleichzeitig, bis we- 
niger als 32 Datenbytes in der Bildelemente-Schnittstel- 
le stehen, wobei zu diesem Zeitpunkt weitere anhangen- 
de Abrufe von Daten aus dem Speicher bedient werden. 
Der Abruf von Codierdaten umfaBt einen Makroblock 

io von 16 mal 16 Bytes Dieser Speicherzugriff kann an 
einer beliebigen DRAM-Zeilenadresse durch eine Spei- 
cheranforderung der Eingabedaten unterbrochen wer- 
den. Die Unterbrechung des Speicherzugriff s verhin- 
dert einen Datenuberlauf an der Bildelemente-Schnitt- 

15 stelle. 

Die Makroblockdaten werden vorabgeruf en, um eine 
Blockierung der Codiererpipeline zu verhindern. Wenn 
die Makroblockdaten verfugbar sind, beginnt der Co- 
dierprozeB. Der DatenfluB der Makroblockdaten hangt 

20 von dem verarbeiteten Bildtyp ab. Zum Zweck der vor- 
liegenden Beschreibung wird angenommen, daB eine 
vorausschauende Bildverarbeitung durchgefuhrt wird 
Dann werden bei einem P-Bild die aktuellen Makro- 
blockdaten fur alle drei Bauelemente gleichzeitig bereit- 

25 gestellt Die Datenbenutzung innerhalb jedes Chips ist 
unterschiedlich, und der Zeitpunkt, zu dem die Daten 
verwendet werden, ist ebenfaUs unterschiedlich. Der lo- 
gische FluB der Daten dieses Makroblockes ist, wenn sie 
von alien empfangenden Bauelementen empfangen 

30 werden, vom S-Chip 801 zum R-Chip 901 und dann 
zur iick zum I-Chip 501. 

Verarbeitung im Suche-Chip 

35 Suche-Eingabepuffer 

lm Suche-Chip 801, der in Fig. 8 dargestellt ist, wer- 
den die aktuellen Makroblockdaten hauptsachlich zur 
Bewegungsschatzung benutzt Abhangig vom durch den 

40 Benutzer ausgewahlten Suchformat werden die Makro- 
blockdaten entweder 4 zu 1 oder 2 zu 1 heruntergetastet 
oder verbleiben 1 zu 1 im Eingabepuffer. Ein einzelner 
Suche-Chip 801 stellt im4 zu 1 Format den groBten und 
im 1 zu 1 Format den kleinsten Suchbereich bereit Das 

45 Heruntertasten wird sowohl im 4 zu 1 als auch im 2 zu 1 
Format in horizontaler Richtung durchgefuhrt Diese 
Schema beseitigt die Komplexitat von Vollbild- und 
Feld-Suchen auf der Basis der Bewegungsschatzung in 
denselben heruntergetasteten Daten. Die heruntergeta- 

50 steten Daten werden im Suchspeicher, dem externen 
Speicher, der an den Suche-Chip angeschlossen ist, ge- 
speichert, wobei sie fur den nachfolgenden Bildcodier- 
prozeB als Bezugsdaten verwendet werden. Die Einga- 
bedaten werden in der Bewegungsschatzung verwendet 

55 und stellen eine genauere Differenz zwischen den Daten 
der beiden Bilder bereit Gleichzeitig werden die Daten 
des zuvor codierten Bezugsbildes zur Bewegungsschat- 
zung aus dem Suchspeicher abgerufen. Der Umfang der 
abzurufenden Bezugsdaten fur jeden zu verarbeitenden 

eo Makroblock hangt vom Ort des Makroblockes und vom 
Suchbereich ab. 

Um Chipressourcen (Siliziumflache) zu sparen, kon- 
nen die chipinternen Puffer fur die Bezugsdaten in der 
Bewegungsschatzungseinheit 20 von 128 Zeilen des 

65 Suchfensters gleichzeitig enthalten. Die Bezugsdaten 
werden abgemfen, wenn der SuchprozeB fortschreitet 
Die Puffer fur die Bezugsdaten umfassen zwei gleich- 
groBe Einheiten. Eine dieser Einheiten wird fur die Da- 
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ten der ungeradzahligen Z^|^erwendet und die an- 

dere fur die Daten der geradzahligen Zeilen. Die beiden 
Puffer sind separate Funktionseinheiten. Somit konnen 
die Suchprozesse in den ungeradzahligen Daten und in 
den geradzahligen Daten gleichzeitig stattfinden. 

Die groBte Herausforderung bei der Bewegungs- 
schatzung sind die Anforderungen an die Verarbei- 
tungskapazitat Urn die Suchschaltung zu minimieren, 
werden Feldsuchen zusammen ausgefuhrt, und die Er- 
gebnisse der Feldsuchen werden kombiniert, um Voll- 
bild-Sucbergebnisse zu bildert Zum Beispiel seien CF1 
die ungeraden Zeilen der aktuellen Makroblockdaten, 
CF2 die geraden Zeilen der aktuellen Makroblockdaten, 
Rfl die ungeradzahligen Zeilen der Bezugsdaten, und 
Rf2 seien die geradzahligen Zeilen der Bezugsdaten. 

Es werden vier Feldsuchen gleichzeitig ausgefuhrt, 
Cfl gegen Rfl, Cfl gegen Rf2, Cf2 gegen Rfl und Cf2 
gegen RfZ Die Ergebnisse von Cfl gegen Rfl und von 
Cf2 gegen Rf2 sowie von Cf2 gegen Rfl und von Cfl 
gegen Rf2 werden kombiniert, um die Vollbild-Sucher- 
gebnisse zu bilden. Dieses Schema laBt die die vollbild- 
Suchschaltung iiberfliissig werden. 

Suche-Chip Ergebnis 

Es werden funf vollstandige Bildelementeergebnisse 
fur jeden vollbildstrukturieren Makroblock erzeugt Fur 
jeden feldstrukturieren Makroblock werden bis zu zwei 
vollstandige Bildelementeergebnisse erzeugt, eine beste 
Obereinstimmung fur das aktuelle ungeradzahlige Feld 
und eine beste Obereinstimmung fur das aktuelle gerad- 
zahlige Feld. 



10 



15 



20 



25 



30 



X-Chip-Schnittstelle 

Die X-Chip-Schnittstelle 831 unterstutzt die Kommu- 
nikation zwischen dem Suche-Chip 901 und dem weiter- 
verarbeitungs-Chip oder Rekonstruktions-Chip 801 so- 
wie zwischen weiteren Suche-Chips 901 innerhalb der 
{Configuration. Fur jeden Makroblock werden bis zu 
funf Suchergebnisse, ein Vollbild und vier Felder, fiber 
diese Schnittstelle an den R-Chip weitergeleitet Diese 
Schnittstelle wird ebenfalls fur Kommunikationen zwi- 
schen Suche-Chip 901 und Suche-Chip 901 verwendet 
Bei Multi-Suche-Chip-Konfigurationen besitzt jeder 
Suche-Chip 901 eine Chipkennung. Ein vordefiniertes 
Verdrahtungsschema an den AnschluBkontakten des 
Suche-Chips 901 wird als Chipkennung oder Adresse 
verwendet Die Adresse 0 kennzeichnet den Suche-Chip 
901, der die Hauptkommunikation mit dem R-Chip 801 
ausfuhrt Die Codiererstruktur kann einen, zwei oder 
vier Suche-Chips 901 unterstutzea Adresse 3 kenn- 
zeichnet den letzten Suche-Chip in der Kette. In einer 
Konfiguration mit vier Suche-Chips wird das Suchfen- 
ster in vier Viertel unterteilt Adresse 0 verwaitet das 
obere linke Viertei, Adresse 1 verwaitet das obere rech- 
te Viertel, Adresse 2 verwaitet das untere linke Viertel 
und Adresse 3 verwaitet das untere rechte VierteL Su- 
che-Chip 3 gibt das Suchergebnis an Suche-Chip 2 wei- 
ter, wenn es verfugbar ist Ahnliches gilt fur die Uberga- 
be von Suche-Chip 2 auf 1 und von Suche-Chip 1 auf 0. 
Das Ergebnis fur die beste Obereinstimmung, das von 
dem Suche-Chip mit der hoheren Adresse erhalten wird, 
wird mit dem Ergebnis des empfangenden Chips vergli- 
chen. Das bessere der beiden Ergebnisse wird dann an 
den nachsten Suche-Chip weitergeleitet. SchlieBlich 
wird die beste Obereinstimmung von alien Suche-Chips 
durch den Suche-Chip 0 ausgewahlt und an den R-Chip 
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zuruckgegeben. 

Verarbeitung im R-Chip 

R-Eingabepuffer 

Die Daten des aktuellen Makroblockes, die zuvor 
vom Intra-Chip 601 empfangen wtirden, werden auf die- 
sem Chip gepuffert und innerhalb des Weiterverarbei- 
tungsprozesses verwendet 

Im IPB-Modus bleibt die Verarbeitung im R-Chip 801 , 
hinter der im Suche-Chip 901 zuruck. Um sicherzustel- 
len, daB die Pipeline standig gefullt ist, ist der Puffer 
groB genug, um die Daten von zwei Makroblocken zu 
fassen. Die Daten des nachsten aktuellen Makroblockes 
werden abgerufen, wenn sowohl im Suche-Eingabepuf- 
fer als auch im R-Eingabepuffer Platz ist 

R-Bewegungsschatzung 

Die Bezugsdaten sind im bislang im externen Spei- 
cher, d. h. im mit dem R-Chip, d. h. dem Weiterverarbei- 
tungs-Chip oder Rekonstruktions-Chip, verbundenen 
Rekonstruktionsspeicher gespeichert wordeiL Die Be- 
zugsdaten bestehen, wie es der Name mit sich bringt, 
aus rekonstruierten Daten. Wenn diese Daten zur Ver- 
feinerung der Bewegung benutzt werden, erzeugen sie 
eine Vorhersagedifferenz, die mit der ubereinstimmt, 
die durch den Decoder rekonstruiert wird. Dieses Sche- 
ma minimiert den Unterschied zwischen den Kompri- 
mierungs- und Dekomprimierungsprozessen. 

Der R-Chip 801 empfangt ebenfalls das Suchformat, 
das durch den Benutzer ausgewahlt worden ist In Ab- 
hangigkeit von dem Suchformat werden die vom Suche- 
Chip 901 empfangenen Ergebnisse auf die Auflosung 
des Gesamtbildes umskaliert Auf der Grundlage des 
Suchergebnisses erfolgt eine Verfeinerung der Suche, 
einschHeBlich der Ergebnisse aus dem I zu 1 (nicht her- 
untergetasteten) Format In der Konfiguration mit 3 
(oder mehr) Chips wird ein maximaler Verfeinerungs- 
Suchbereich von H-/— 4horizontal und 4- / — Iverrikal 
verwendet 

Eine weitere groBe Herausforderung bei der Bewe- 
gungsschatzung ist die Speicherbandbreite. Die aus dem 
Rekonstruktionsspeicher abgerufenen Bezugsdaten 
werden chip-intern gepuffert, bis die Vollbild-Differenz- 
daten erzeugt worden sind Dieses Schema nunimiert 
den externen Speicherverkehr. Jedes Suchergebnis wird 
zuerst an einer Bildelementegrenze verfeinert Bis zum 
nachsten VerfeinerungsprozeB, der Halbbildelement- 
Verarbeitung, schlieBen sich maximal drei Ergebnisse 
mit vollen BUdelementen an Bis zu acht Halbbildele- 
ment-Makroblocke konnen zur weiteren Halbbildele- 
ment-Verfeinerungs-Suche um jedes Ergebnis der Voll- 
bild element- Verfeinerung gekennzeichnet werden. Alle 
Ergebnisse der Voll- und Halbbildelement- Verfeinerun- 
gen werden zu dem chip-internen Prozessor, das heiBt 
dem R- Prozessor iibertragen. 

IR-Chip-Sclmittstelle 

In Abhangigkeit vom Suchetyp bestimmt der R-Pro- 
zessor den Makroblocktyp und den Bewegungsvektor 
fur jeden Makroblock. Auswahlbare Suchetypen kon- 
nen die Bewegung von Nur-Vollbildern, von Nur-Fel- 
dern, von Nur-Volle-Bildelementen, Nur-Halbe-Bildele- 
menten und die adaptive VollbUd/Feld-Bewegung ent- 
halten. Wenn die adaptive Vollbild/ Feld-Bewegungs- 
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schatzung ausgewahlt ist, wird deS^BT besten uberein- 
stimmende Makroblock verwendet, um den Codierpro- 
zeB fortzusetzen. Auf der Grundlage der besten Ober- 
einstimmung werden die ubereinstimmenden Farbwert- 
daten aus dem Rekonstruktionsspeicher wiederherge- 
stellt Es werden sowohl die Helligkeits- als auch die 
Farbwert-Voilbild-Differenzdaten erzeugt und in der 
Intra-Chip- €01 und R-Chip- 801 SchnittsteUe gepuffert. 
Die Helligkeitsdifferenzdaten werden zuerst in den In- 
tra-Chip 601 ubertragen. Wenn die quantisierten Hellig- 
keitsdaten an den R-Chip 801 zuruckgegeben werden, 
werden die Farbwert-Differenzdaten zum Intra-Chip 
601 ubertragen. Sowohl die Differenzdaten als auch die 
quantisierten Daten teilen sich denselben bidirektiona- 
len Datenbus zwischen dem Intra-Chip 601 und dem 
R-Chip 801. Die Dateniibertragungen werden stufen- 
weise durchgefuhrt, um BuskoJIisionen zu verhindern. 

Zusatzlich zu den Helligkeits- und Farbwert-Diffe- 
renzdaten berechnet und ubertragt der R-Chip entspre- 
chende Bewegungsvektordaten fur jeden Nicht-Intra- 
Makroblock an den I-Chip. Diese Daten werden durch 
den R-Prozessor gesendet, wenn sie vom I-Chip ange- 
fordert werden. 

Die quantisierten Daten werden zuerst an den inver- 
sen Quantisierer 941, dann an die inverse DCT-Einheit 
943 und dann schlieBlich an die Bewegungskompensa- 
tionseinheit 945 weitergeleitet Die IDCT-Daten wer- 
den fur die Bewegungsnachstellung in der Bewegungs- 
kompensations- (MC) Einheit 945 zu den aktuellen Ma- 
kroblockdaten, des Makroblockes der in der Makro- 
blocksuche verwendet wurde, hinzugefugt Die MC-Ein- 
heit 945 erzeugt die rekonstruierten Daten. Sie werden 
gepuffert und fur das Speichern im Rekonstruktions- 
speicher vorbereitet und als Verfeinerungs-Bezugsda- 
ten fur die nachfolgende Bildcodierung verwendet 

Beim IP-Codierformat werden die Suche- Verfeine- 
rungsschaltungen auf dem R-Chip 801 als kleiner Bewe- 
gungsschatzer verwendet. Das Zentrum des Suchfen- 
sters ist der Ort des aktuellen Makroblockes. Der 
R-Chip 801 kann Suchbereiche bis zu +/— 8horizontal 
und +/ — 7vertikal im IP-Modus unterstutzen. Ahnlich 
wie beim IPB-Codierformat werden die Bezugsdaten 
pro Makroblock einraal abgeruf en. Diese Daten werden 
chip-intern gepuffert, bis die Vollbild-Differenzdaten er- 
zeugt werden. Zuerst wird eine Bewegungsschatzung 
auf Grundlage voller Bildelemente ausgefuhrt. Dann 
wird eine Verfeinerungssuche mit den am besten uber- 
einstimmenden VoUe-Bildelemente-Makroblockdaten 
ausgefuhrt. Zwei Verfeinerungen werden durchgefuhrt: 
eine Suche mit doppelt bereitgestellten Daten und eine 
Halbbildelemente-Suche. 

Wenn Bewegungsschatzungssuchen mit doppelt be- 
reitgestellten Daten fur Bilder in VoUbildstruktur ausge- 
fuhrt werden, werden die am besten ubereinstimmen- 
den Vollbildelemente-Makroblockdaten in ungeradzah- 
lige und geradzahlige Felddaten auf gespalten. Fur jedes 
Feld werden Daten der entgegengesetzten Paritat, wel- 
che eine Differenz von + / — 1 besitzen, nach der Be- 
rechnung der doppelt bereitzustellenden Bezugsdaten- 
Abrufadresse uber Bewegungsvektor-Skalieroperatio- 
nen, wie sie im MPEG2-Standard spezifiziert werden, 
aus dem externen Speicher abgerufen. Die Felddaten 
werden mit den Daten ihrer entgegengesetzten Paritat 
interpoliert, um die Bezugsdaten zu bilden, die in der 
Suche mit doppelt bereitgestellten Daten verwendet 
werden. 

Die Halbbildelement-Verfeinerung wird uber einen 
ProzeS durchgefuhrt, der dem in der IPB-Codierung 
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verwendeten ahnelt j^^pfrgebnisse, einschlieBlich der 
Vollbildelement-Suche, der Suche mit doppelt bereitge- 
stellten Daten und der Halbbildelement-Suche werden 
durch den R-Prozessor gesammeit Die verbleibenden 
5 Prozesse ahnlichen denen im IPB-Modus. 

Bezugsspeicher-Schnittstelle 

In jeder Makroblockverarbeitung gibt es einen Abruf 

to von Bezugsdaten, einen Zugriff auf doppelt bereitzu- 
stellende Daten, einen Abruf der am besten uberein- 
stimmenden Farbwertdaten, ein Speichern der rekon- 
struierten Helligkeitsdaten und ein Speichern der re- 
konstruierten Farbwertdaten. Um die Anforderungen 

is an die Speicherbandbreite zu verringern, werden die 
Bezugsdaten nur einmal pro Makroblock abgerufen. 
Um sicherzustellen, daB die Pipeline einheitlich gefullt 
ist, werden die Speicheroperationen auf Grundlage des 
Platzes des Makroblockes im Bild in einer speziellen 

20 Reihenfolge bearbeitet Da die Bewegungsschatzung 
nur mit den Helligkeitsdaten ausgefuhrt wird, werden 
zur Verbesserung der Speicherlesegeschwindigkeit fiir 
eine spezielle Operation die Helligkeits- und Farbwert- 
daten in unterschiedlichen Bereichen des Rekonstruk- 

25 tionsspeichers abgelegt. 

Entropiecodierung im Intra-Chip 



Intra-Prozessor 
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Der Intra-Prozessor 601 wird detailliert in Fig. 6 dar- 
gestellt Wenn die aktuellen Makroblockdaten im Voll- 
bildspeicher verfugbar gemacht werden, wird durch den 
I-Prozessor 601 der Energiegehalt des Makroblockes 

35 berechnet, welcher verwendet wird, um fur die beste 
Geschwindigkeitssteuerung ein Quantisierungsniveau 
zu bestimmen. Mit den Vollbild-Differenzdaten wird 
durch den I-Prozessor eine Vollbild- oder Feld-DCT- 
Entscheidung getroffen, wenn diese vom R-Chip 801 

40 zuruckgegeben werden. Der Intra-Prozessor 601 besitzt 
die Eigenschaft, daB er dynamisch unterteilt werden 
kann, was es ihm gestattet, als vier 1-Byte-Einheiten 
oder als eine 4-B3^te-Funktionseinheit zu arbeiten. So- 
wohl die Quantisierungs- als auch die FelcWollbild- 

45 DCT-Berechnungen werden im unterteQten Modus aus- 
gefuhrt, was einen vierf achen Leistungsgewinn bringt 

In Abhangigkeit vom Eingabebild und von der spezi- 
fizierten Ausgabe-Bitgeschwindigkeit konnen Ober- 
lauf- oder Unterlauf-Bedingungen auftreten. Es liegt in 

50 der Verantwortlichkeit der Geschwindigkeitssteuerung, 
das Auftreten beider Bedingungen zu verhindern. Um 
einen Oberlauf zu verhindern sind die Verwendung ei- 
ner reinen DCT und externe FIFO-Riickkopplungen in- 
stalliert worden. Auffulloperationen sind vorgesehen, 

55 um den Unterlauf zu steuern oder sogar zu beseitigea 
Die Bildcodierzeit hangt vom Eingabeformat und 
dem Codierformat ab. Die Bildgeschwindigkeit wird 
durch die Anwendung spezifiziert. Der Bildabstand ist 
die Zeit, wahrend derer der Codierer bei der Bildcodie- 

€0 rung nicht beschaftigt ist Der Bildabstand wird durch 
die Bildgeschwindigkeit und die Bildcodierzeit be- 
stimmt Wenn Auffulloperationen erforderlich sind, 
werden diese wahrend des Bildabstandes durchgefuhrt. 
Dies begrenzt die maximale Anzahl Bits, die der Codie- 

65 rer pro Abstand auffullen kann. Der Codierer verfolgt 
die Anzahl Bits, die pro Bild erzeugt werden und die sich 
in einem Bild befinden. Wenn die Anzahl der erzeugten 
Bits pro Bild kleiner ist als die im Bild befindlichen Bits, 
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wird das AuffuUen benutz^^Pf die unbenutzten Bits 
aufzufullen. Die unbenutzten Bits eines Bildes konnen 
uber mehrere Bildabstande aufgefullt werden. Dieser 
Mechanismus stellt sicher, daB die Bitfoige der Anwen- 
dung entspricht, ohne die Leistungsfahigkeit herabzu- 5 
setzen. 

Quantisierer 

In der Quantisierer einheit ist die Moglichkeit 2mm to 
Abschneiden der Koeffizienten integriert Das Koeffi- 
zient-Abschneideregister, das vom Mikrocode geschrie- 
ben wird, wird verwendet, um die Position des letzten 
von nuD verschiedenen Amplituden-Koeffizienten in- 
nerhalb eines Blockes zu speichern. Wenn die Ge- 15 
schwindigkeitssteuerung eine dem Oberiauf nahe konv 
mende Bedingung erkennt, kann der Code einen Wert in 
das Koeffizient-Abschneideregister schreibeiL Dieser 
Wert wird auf der Grundlage der Nahe zum Oberiauf 
berechnet. Alle Koeffizienten hinter dem Platz, der im 20 
Koeffizient-Abschneideregister spezifiziert wird, wer- 
den zu null gemacht Dieses Schema wird ebenf alls ver- 
wendet, um eine beschrankte Bitfoige zu erzeugen. Eine 
beschrankte Bitfoige ist im MPEG2 Main Profile at 
Main Level Standard so beschrieben, daB alle Makro- 25 
blocke innerhalb eines Sektors, mit Ausnahme von zwei 
. Makroblocken, jeweils weniger als 4608 Bits enthalten 
mussen. Der Codierer verfolgt die pro Makroblock er- 
zeugten Bits und die Anzahl der Makroblocke innerhalb 
eines Sektors, die mehr als 4608 Bits besitzen. Wenn 30 
zwei Makroblocke erkannt werden, die mehr als 
4608 Bits besitzen, wird das Koeffizient-Abschneidere- 
gister fur den Rest des Sektors auf 31 gesetzt. In diesem 
Fall benutzt der Chip die 31 ersten Koeffizienten jedes 
8x8 Blockes, um die Bitfoige zu bilden. Die Zahl der pro 35 
Koeffizient verwendeten Bits hangt vom Wert des Ko- 
effizienten ab. Vierundzwanzig Bits werden verwendet, 
um einen maximal en Wert zu codieren. Unter der Vor- 
aussetzung, daB alle 31 Koeffizienten die maximale Zahl 
enthalten, werden im 4 : 2 : 0 Format 4464 Bits erzeugt 40 
Dieser Mechanismus stellt sicher, daB die Ausgabebit- 
folge beschrankt ist und setzt ebenfalls einen oberen 
Grenzwert fur die Anzahl der erzeugten Bits, um einen 
Oberiauf zu verhindern. 

45 

Veranderliche-Langen-Codierer 

Der Ausgabewert der Quantisierung wird vor der 
ZZ-Abtastverarbeitung zur Rekonstruktion des Bildes 
auf den R-Chip 801 zuriickgegeben. Dies beseitigt eine 50 
gewisse Entwurfskomplexitat, und auf dem R-Chip 801 
ist keine inverse ZZ-Funktion erforderiich. Das Abtast- 
format kann an der Leitrechner-Schnittstelle ausge- 
wahlt werden. Der Mikrocode kann das Abtastformat 
ebenfalls auf Grundlage des Bildformates auswahlen. 55 
Eine abwechselnde Abtastung wird fur eine Zeilen- 
sprung-Codiemng verwendet und eine traditionelle Ab- 
tastung fur fortlaufende Bilder. 

Auf die quantisienen Daten wird eine ZZ-Abtastung 
angewandt, weiche mittels der Huffman-Tabelle mit 6<j 
veranderlicher Lange codiert wird. Die Daten verander- 
licher Lange werden in einem Puffer gespeichert Ein 
codiertes Blockmuster, wie es im MPEG2-Standard de- 
finiert ist, wird verwendet, um anzuzeigen, welcher 
Block im Makroblock von null verschiedene Daten ent- 55 
halt Wenn alle Blocke codiert sind, werden den VLC- 
Dateri Kopfzeilen hinzugefugt 
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SchnittstelSRm komprimierten Speichern 

Die Kopfzeilen werden in einer flexiblen Art und 
Weise erzeugt Die Kopfzeilendefinitionen sind in einer 
programmierbaren Tabelle gespeichert Der Mikrocode 
besitzt ebenfalls die Fahigkeit, den Inhalt der Kopfzei- 
lentabelle zu verandern, wenn im MPEG2-Standard 
Veranderungen auftreten. In Abhangigkeit von den An- 
forderungen der Anwendung trifft der Mikrocode die 
Auswahl, weiche Kopfzeilen erzeugt werden soil. Die 
elementare Folge ergibt sich aus den Koeffizientenda- 
ten zusammen mit den Kopfzeilen. 

Integriertes System 

In einer Ausfuhrungsform wird gemaB unserer Erfin- 
dung ein dem MPEG2-Standard entsprechendes digita- 
les Videocodierersystem bereitgestellt, das ein I-Voll- 
bild-Videocodierermodul 601 mit (1) einer Leitrechner- 
Schnittstelle 611, (2) einer Bildelemente-Schnittstelle 
641 zum Empfangen von Bildeiementedaten uber einen 
Bildelementebus 643, (3) einer Vollbildspeicher-Schnitt- 
stelle 651 zum Empfangen und Senden von Vollbildda- 
ten, (4) einem diskreten Kosinustransformations-Pro- 
zessor 671, (5) einer Quantisierungseinheit (673), (6) ei- 
nem Veranderliche-Langen-Codierer 675, (7) einem FI- 
FO-Puffer 677 und (8) einer Schnittstelle zum kompri- 
mierten Speichern 679 besitzt, um eine I-Vollbilder ent- 
haltende Bitfoige zu erzeugen.. 

In einer weiteren Ausfuhrungsform der skalierbaren 
Architektur des dem MPEG2-Standard entsprechenden 
digitalen Yideocodierersystems enthalt das I-Vollbild- 
Videocodierermodui eine Schnittstelle (9) zu einem Be- 
wegungsschatzungsmittel, und das System enthalt des- 
weiteren einen zweiten Prozessor, d. h. ein R-Prozessor- 
elemente 901 mit (10) einer Bezugsspeicher-Schnittstel- 
le 911, (11) einem Bewegungsschatzungsmittel 903, (12) 
einem inversen Quantisierungsmittel 941, (13) einem in- 
versen diskreten Kosinustransformationsmittel 943 und 
einem Bewegungskompensationsmittel 945. Das System 
enthalt ebenfalls mindestens ein drittes Prozessorele- 
ment oder Suche-Prozessorelement 801 mit (14) einer 
Suchspeicher-Schnittstelle und (15) einem Bewegungs- 
schatzungsmittel 801. Diese Ausfuhrungsform stellt eine. 
I-P-B-Datenfolge bereit 

Der Codierer kann die Form eines einzelnen inte- 
grierten Schaltkreischips oder einer Vielzahl integrier- 
ter Schaltkreischips haben. Zum Beispiel konnen sepa- 
rate integrierte Schaltkreischips fur das I-Vollbild-Vi- 
deocodierermodul, das zweite Prozessorelement 901 
und das dritte Prozessorelement 801 vorhanden sein. Es 
kann ebenfalls mehr als ein solches drittes Prozessorele- 
mente 801 vorhanden sein. 

Gem&fl einer alternativen Ausfuhrungsform unserer 
Erfindung wird ein digitales Videocodierersystem be- 
reitgestellt, wobei das I-Vollbild-Videocodierermodul 
601 eine Schnittstelle (9) zu einem Bewegungsschat- 
zungsmittel enthalt, und das System enthalt des weite- 
ren nur ein zweites oder R-Prozessorelement mit (10) 
einer Bezugsspeicher-Schnittsteile 911, (11) einem Be- 
wegungsschatzungsmittel 903, (12) einem inversen 
Quantisierungsmittel 941, (13) einem inversen diskreten 
Kosinustransformationsmittel 943 und einem Bewe- 
gungskompensationsmittel 945. Diese Ausfuhrungsform 
ist zur Erzeugung einer I-P-Datenfolge nutzlich. 

Wenngleich die Erfindung unter Bezugnahme auf be- 
stimmte bevorzugte Ausfuhrungsformen und Beispiele 
beschrieben worden ist, ist nicht beabsichtigt, das Ge- 
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biet der Erfindung, das durch die 
che definiert wird, einzuschranken. 
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15 



25 



35 



1. Dem MPEG2-Standard entsprechendes digitales 
Videocodierersystem mit skaiierbarer Architektur, 
ein I-VollbUder-Videocodierennodul aufweisend 
mit (1) einer Leitrechner-Schnittstelle, (2) einer 
BildeJemente-Schnittstelle zum Empfangen von 
Bildelementedaten uber einen Bildelementebus, (3) 
einer Vottbildspeicher-Schnittstelle zuxn Empfan- 
gen und Senden von Vollbilddaten, (4) einem dis- 
kreten ICosinustrans-formations-Prozessor, (5) ei- 
ner Quantisierungseinheit, (6) einem Veranderli- 
che-Langen-Codierer, (7) einem FIFO-Puffer and 
mit (8) einer Schnittstelle zum komprimierten Spei- 
chern, um eine I-Vollbilder enthaltende Bitfolge zu 
erzeugen. 

2. Dem MPEG2-Standard entsprechendes digitales 20 
Videocodierersystem mit skaiierbarer Architektur 
gemaB Anspruch 1, wobei das I-Vollbilder-Video- 
codierermodul eine Schnittstelle (9) zu einem Be- 
wegiingsschatzungsmittei enthalt und wobei das 
System des weiteren enthalt: 

(a) ein zweites Prozessorelemente mit (10) ei- 
ner Bezugsspeicher-Schnittstelle, (11) einem 
Bewegungsschatzungsmittel, (12) einem inver- 
sen Quantisierungsmittel, (13) einem inversen 
diskreten Kosinustransformationsmittel und 30 
einem Bewegungskompensationsmittel; und 

(b) mindestens ein drittes Prozessorelement 
mit (14) einer Suchspeicher-Schnittstelle und 
(15) einem Bewegungsschatzungsmittel; 

zur Erzeugung einer I-P-B-Datenfolge. 

3. Dem MPEG2-Standard entsprechendes digitales 
Videocodierersystem mit skaiierbarer Architektur 
gemaB Anspruch 2, wobei das Codierersystem ei- 
nen einzeinenintegrierten Schaltkreischip umfaBt 

4. Dem MPEG2-Standard entsprechendes digitales 40 
Videocodierersystem mit skaiierbarer Architektur 
gemaB Anspruch 2, wobei das Codierersystem eine 
Vielzahl integrierter Schaltkreischips umfaBt 

5. Dem MPEG2-Standard entsprechendes digitales 
Videocodierersystem mit skaiierbarer Architektur 45 
gemaB Anspruch 4, wobei das Codierersystem se- 
parate integrierte Schaltkreischips fur das I-VoU- 
bild-Videocodierermodul, das zweite Prozessorele- 
ment und das dritte Prozessorelement umfaBt 

6. Dem MPEG2-Standard entsprechendes digitales 50 
Videocodierersystem mit skaiierbarer Architektur 
gemaB Anspruch 2, ein drittes Prozessorelement 
aufweisend 

7. Dem MPEG2-Standard entsprechendes digitales 
Videocodierersystem mit skaiierbarer Architektur 55 
gemaB Anspruch 2, mehr als ein drittes Prozessor- 
element aufweisend. 

8. Dem MPEG2-Standard entsprechendes digitales 
Videocodierersystem mit skaiierbarer Architektur 
gemaB Anspruch 1, wobei das I-Vollbilder- Video- 60 
codierermodul eine Schnittstelle (9) zu einem Be- 
wegungsschatzungsmittel enthalt und wobei das 
System des weiteren ein zweites Prozessorelement 
mit (10) einer Bezugsspeicher-Schnittstelle, (11) ei- 
nem Bewegungsschatzungsmittel, (12) einem inver- 65 
sen Quantisierungsmittel, (13) einem inversen dis- 
kreten Kosinustransformationsmittel und einem 
Bewegungskompensationsmittel enthalt, um eine 
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